查看原文
其他

学术成果 | 时空约束的非负矩阵分解方法挖掘出租车出行时空模式

未名时空 未名时空 2021-09-20

01

内容导读

出租车出行流中蕴含丰富的信息,有助于深入理解城市居民出行的时空特征。矩阵是表达出行流的常用模型,使用矩阵分解方法可以提取潜在出行特征,但传统的矩阵分解方法无法处理出行流中的时空自相关特征。因此,提出考虑时空自相关约束的非负矩阵分解方法(STC-NMF),显式建模时空依赖,准确挖掘海量出行流中的时空模式。使用北京市2015年三个月的出租车出行数据,分别建立位置-时间矩阵和O-D矩阵表达出租车出行流,使用STC-NMF方法,分别发现了工作日和休息日的3种出发模式、4种到达模式和8种空间交互模式,并且发现典型出行流的距离衰减效应。STC-NMF相比传统矩阵分解方法更适用于时空数据,研究成果对于出租车服务与城市交通管理具有价值。

02

方法

基于出租车出行数据,建立位置-时间矩阵表达乘客出发和到达的时空分布(图1a),其中矩阵的行表示乘客上车或下车的位置,列表示时间,矩阵的元素表示在给定位置和时间内的平均上车/下车人数。建立O-D矩阵表达乘客出行的空间交互量(图1b),矩阵的行和列分别表示乘客上车和下车的位置,元素表示对应起止位置的平均出行流量。

图1 出租车出行的矩阵表示:(a) 位置-时间矩阵,

(b) O-D矩阵


给定矩阵R∈ℝ+m×n和正整数k<min (m,n),经典非负矩阵分解方法(NMF)寻找两个非负矩阵U∈ℝ+m×kV∈ℝ+k×n,最小化目标函数

其中λuλv为正则化参数,UV的积是R的近似且秩最大为k。如果矩阵的行和列分别表示不同的对象,则NMF提取矩阵中的k个潜在特征,且UV分别表达特征在行对象和列对象上的贡献的分布。

在表达出租车出行的位置-时间矩阵和O-D矩阵中,相邻位置的出行量之间存在空间相关性,而相邻时间的出行量之间则存在时间相关性。经典的非负矩阵分解方法无法处理出行数据中的时空依赖,而导致结果的偏差。因此,提出时空约束的非负矩阵分解方法(STC-NMF),显式建模时空自相关特征。基于半变异函数理论度量空间自相关:

其中,xixj表示空间位置,Z(x)表示位置x上的观测值;Sij是位置xixj之间的空间权重,可以表示为连续的距离衰减函数或者二值的空间邻接关系。

基于一阶马尔可夫链度量时间自相关:
其中titj表示时间,Z(t)表示时间t上的观测值;Tij是时间titj之间的时间权重,对相邻时间取1,否则取0。则STC-NMF通过增加空间自相关和时间自相关的惩罚项纳入时空约束,最小化目标函数:
其中λuλv分别表示矩阵行和列上的自相关约束的正则化参数;WijrWijc分别表示行和列上的自相关系数,根据所表达的对象分别对应空间自相关系数Ms或时间自相关系数Mt对于出租车出行流,在位置-时间矩阵中,行之间存在空间自相关,列之间存在时间自相关,则STC-NMF的目标函数表达为:
而在O-D矩阵中,行和列上都只考虑空间自相关,则STC-NMF的目标函数表达为:
采用最小残差平方和的方法确定最优k值,扩展multiplicative update算法求解STC-NMF模型。

03

实验及结果

(1)数据描述

使用北京市2015年5月-7月的33,000辆出租车的GPS轨迹,经过预处理后,提取其中的上车点和下车点,共15,033,149条出行流。以北京市五环以内区域为研究区,将其划分为500m×500m的均匀格网,一共900个格网单元。对于工作日和休息日的出行,分别将出行量平均到一天24小时,各建立2个900×24的位置-时间矩阵表达上车量和下车量,各建立一个900×900的O-D矩阵表达空间交互流量。


(2)工作日出行模式

分别对工作日的上车量和下车量的位置-时间矩阵应用STC-NMF进行矩阵分解,提取工作日出行的空间和时间模式(图2)。发现工作日内出租车乘客的4种出发模式,分别对应:工作时段内主要工作地附近的业务出行(10.6%),早高峰期城市周边向中心的通勤出行(28.3%),北京西部和北部地区离开大型公园的人流(26.9%),以及深夜从三里屯和后海等地区结束夜生活后离开的人流(2.6%)。同时,发现工作日内乘客的3种到达模式,分别对应:主要工作地内在正常工作时段内业务出行的返回人流(30.2%),早晚高峰期的通勤人流(10.9%),以及在下午和傍晚抵达公园和休闲场所的人流(32.8%)。出发模式和到达模式具有较好的对应关系。


工作日出行模式:(a) 出发模式,(b) 到达模式


(3)休息日出行模式

分别对休息日的上车量和下车量的位置-时间矩阵应用STC-NMF进行矩阵分解,提取休息日出行的空间和时间模式(图3)。发现4种出发模式,分别对应:中午时段从知名旅游景点离开的人流(29.0%),深夜从三里屯和南锣鼓巷等结束夜生活后离开的人流(0.7%),傍晚时分没有特定目的的出行(4.5%),以及上午从四环外进城进行各种周末活动的出行流(32.7%)。同时,发现3种到达模式,分别对应:早晨去驾校学车和到机场赶早班飞机的人流(33.8%),中午至晚上时段内结束周末活动返回城市周边地区的人流(37.3%),白天抵达公园和休闲场所度周末的人流(0.2%)。休息日的出发模式和到达模式也具有较好的对应关系。


图3 休息日出行模式:(a) 出发模式,(b) 到达模式


(4)空间交互模式

分别对工作日和休息日出租车出行量的O-D矩阵应用STC-NMF进行矩阵分解,提取空间交互模式,各发现8种主要模式(图4),可以发现以工作、通勤、购物和娱乐等为目的以及以交通枢纽、公园和商业区为中心的典型出行流。这8种空间交互模式与工作日和休息日的出发/到达模式也具有一定程度的对应关系。


图4 空间交互模式:(a) 工作日,(b) 休息日


无论工作日还是休息日的出租车出行流,出发位置和达到位置都表现出较强的聚集特征,短距离出行都占据较大的比例。提取交互模式中特征强度>40%的O、D区域之间的出行流,识别为各模式的典型出行。如图5所示,典型出行具有显著的距离衰减效应,随着距离增大,出行量显著降低。


5 典型出行流的距离衰减:(a) 工作日,(b) 休息日


04

结语

以矩阵的形式表达出租车出行,对其中的空间相关性和时间相关性显示建模,以此扩展非负矩阵分解模型,建立时空约束的非负矩阵分解方法,更好地发现出租车轨迹中蕴含的时空模式,并可以进一步应用于出租车需求预测、城市居民活动行为理解和城市交通规划等。该方法也同样适用于其他类型的时空交互的分析与模式发现。


参考文献

Yong Gao, Jiajun Liu, Yan Xu, Lan Mu, Yu Liu (2019). A Spatiotemporal Constraint Non-Negative Matrix Factorization Model to Discover Intra-Urban Mobility Patterns from Taxi Trips. Sustainability, 11(15), 4214. DOI: 10.3390/su11154214



素材来源:S³-Lab

材料整理:高  勇

内容排版:杨桃汝



点击阅读原文可查看论文

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存